Rank in Wordlist | Frequency | Word |
---|---|---|
620 | 193 | из-за |
653 | 185 | что-то |
1382 | 102 | финно-угорских |
1434 | 98 | |
1870 | 77 | Ида-Вирумаа |
1996 | 73 | кто-то |
2149 | 68 | 1-2 |
2151 | 68 | 2-3 |
2275 | 65 | какой-то |
2605 | 58 | все-таки |
2616 | 58 | какие-то |
2618 | 58 | какой-либо |
2802 | 54 | 2-х |
2862 | 53 | Кохтла-Ярве |
2930 | 52 | 3-х |
3365 | 46 | по-прежнему |
3395 | 45 | 3-4 |
3525 | 44 | когда-то |
3778 | 41 | где-то |
3900 | 40 | как-то |
Rank in Wordlist | Frequency | Word |
---|---|---|
19869 | 7 | e-maksuamet/e-toll |
31752 | 4 | Рокка-аль-Маре |
37385 | 3 | 1-2-3 |
48801 | 2 | 1-2-комнатную |
48802 | 2 | 1-3-х |
49019 | 2 | 1920-1930-х |
49234 | 2 | 3-5-летней |
49367 | 2 | 55-977-027 |
50399 | 2 | SDMMC-Navi-Start |
55982 | 2 | Эс-Эн-Си |
Rank in Wordlist | Frequency | Word |
---|---|---|
73327 | 1 | 1-2-3-5 |
77010 | 1 | Building-Antenna-Span-Earth |
81248 | 1 | X-Ray-Project-настоящее |
82964 | 1 | «Бу-ра-ти-но |
85347 | 1 | А-,В-,ВЕ-,С-,СЕ- |
87578 | 1 | Вест-хайленд-вайт-терьер |
87579 | 1 | Вест-хайленд-вайт-терьеры |
92223 | 1 | Киeк-ин-де-Кёк |
99410 | 1 | Р-15-040-97 |
100711 | 1 | Свибю-Хусбю-Сёбербю-Норьбю-Дибю-Рялбю-Свибю |
Rank in Wordlist | Frequency | Word |
---|---|---|
85347 | 1 | А-,В-,ВЕ-,С-,СЕ- |
100711 | 1 | Свибю-Хусбю-Сёбербю-Норьбю-Дибю-Рялбю-Свибю |
100725 | 1 | Свисбю-Хулло-Хокабака-Сууремыйза-Бисьбю-Фёрбю-Саксбю-Керслети-Борьбю-Хулло-Свибю |
104078 | 1 | Херес-де-ла-Фрон-тера |
157711 | 1 | требование-заказ-закуп-поставка-скалад-отпуск |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters